草庐IT

sql - Sum on a left join SQL

全部标签

Spark SQL简介与基本用法

ApacheSpark是一个强大的分布式计算框架,SparkSQL是其组件之一,用于处理结构化数据。SparkSQL可以使用SQL查询语言来查询和分析数据,同时还提供了与Spark核心API的无缝集成。本文将深入探讨SparkSQL的基本概念和用法,包括数据加载、SQL查询、数据源和UDF等内容。SparkSQL简介SparkSQL是ApacheSpark的一个模块,用于处理结构化数据。它提供了一个高性能、分布式的SQL查询引擎,可以轻松处理各种数据源,包括结构化数据、半结构化数据和非结构化数据。SparkSQL的主要特点包括:支持SQL查询:您可以使用标准的SQL查询语言来查询和分析数据,无

sql - 比较两个配置单元表之间的计数

我正在尝试对两个表进行计数比较。由于减号运算符在hive中不起作用,因此它没有发生。您能否提供一些简单的方法来对两个表进行计数比较。select'CallDetail-HiveT1toHDFSStaging-DataCompare',casewhencnt>0then'Fail'Else'Pass'endfrom(selectcount(*)cntfrom((selectcount(*)fromstudents1s1)-(selectcount(*)fromstudents2s2))astbl1)astbl2;抛出错误:FAILED:ParseExceptionline81:0cann

sql - hive 日期转换问题

您好,在我的Hive表中,我有一列包含这样的日期值。cl1311020190000003011201900000031122019000000我试过像这样将列值转换为日期格式Selectfrom_unixtime(unix_timestamp(cl1,'yyyy/MM/dd'),'yyyy-MM-dd')fromtable1;它打印NULl。任何帮助将不胜感激。 最佳答案 您说您有dd-mm-yyyy格式的日期,但随后发布的数据中根本没有任何连字符假设31102019000000是31-oct-201900:00:00Selectf

sql - hive 中两条记录之间的差异

我有一个包含5列的表,我需要找到前两条记录的计数列差异。我能够根据某些条件获得前两项记录。例如,我的table看起来像:nameaddresscountcurrent_date_timejohnLA1022019-07-1212:24:38peterMAC1052019-07-1212:24:40johnNY2102019-07-1212:24:02johnWD182019-07-1212:24:12选择查询以获取前两行:SELECTcountFROMtable_nameWHEREname="john"ORDERBYcurrent_date_timeDESCLIMIT2它返回如下:co

SQL注入——extractValue()报错注入

目录 一,注入原理 二,实例(less-5) 一,注入原理函数extractValue()包含两个参数:第一个参数是XML文档对象名,第二个参数是路径以创建数据库ctfstu和数据表xml为示例,展示函数extractValue()的用法1,先在ctfstu数据库内创建表xmlcreatedatabasectfstucharsetutf8;createtablexml(docvarchar(150));2,再在表中插入两段数据INSERTINTOxmlvalues('AbadboyhowtogetagirlfriendLOVEbenben');INSERTINTOxmlvalues('howt

sql - 使用附加列在配置单元中创建表

我是Hive的新手。我想在配置单元中创建表,其中的列与现有表的列相同,外加一些额外的列。我知道我们可以使用这样的东西。CREATETABLEnew_table_nameASSELECT*FROMold_table_name这将创建与old_table_name具有相同列的表。但是如何在new_table_name中指定额外的列? 最佳答案 实现方法如下:Oldtable:hive>describedepartments;OKdepartment_idintfromdeserializerdepartment_namestringfr

sql-server - 在 sqoop-export 中遇到一些问题?

我已经多次将表从Hive导出到SQLServer。我从来没有遇到过这个问题。我使用字段分隔符作为“,”,还在SQLServer中创建了一个表。hadoop@ubuntu:~/sqoop-1.3.0-cdh3u1/bin$./sqoop-export--connect'jdbc:sqlserver://192.168.1.1;username=abcd;password=12345;database=HadoopTest'--tabletmptempmeasurereport--export-dir/user/hive/warehouse/tmptempmeasurereport12/0

hadoop - java.sql.SQLException : Failed to start database '/var/lib/hive/metastore/metastore_db' in hive 异常

我是hive的初学者。当我尝试执行任何配置单元命令时:hive>显示表格;它显示以下错误:FAILED:Errorinmetadata:javax.jdo.JDOFatalDataStoreException:Failedtostartdatabase'/var/lib/hive/metastore/metastore_db',seethenextexceptionfordetails.NestedThrowables:java.sql.SQLException:Failedtostartdatabase'/var/lib/hive/metastore/metastore_db',se

hadoop - PL/SQL 能否可靠地转换为 Pig Lating 或带有 Pig Latin 和 Hive 的 Oozie 管道

我很好奇用Hadoop替换我的Oracle数据库,并且正在学习Hadoop生态系统。如果我要走这条路,我有很多PL/SQL脚本需要替换。我的印象是,通过一些努力,我能够将任何PL/SQL脚本转换/翻译成类似的PigLatin脚本。如果不仅仅是PigLatin,那么通过Oozie结合Hive和Pig。这是正确的吗? 最佳答案 虽然大多数SQL语句都可以翻译成等效的Pig和/或Hive语句,但hadoop文件系统固有的一些限制会传递给语言。主要限制是HDFS是一个一次写入,多次读取的系统。这意味着包含UPDATESQL命令或DELETE

sql - 在 HIVE 中创建与另一个表具有相同列的表?

我想从配置单元中另一个表的一些元数据创建表。我正在使用配置单元。我从this知道可以通过INFORMATION_SCHEMA.COLUMNS从表中检索元数据的问题在SQL中:是否HIVE对表的元数据具有类似的访问权限以允许我使用另一个表的列创建表?本质上,我正在复制一个没有所有元组的表。这是迄今为止我拥有的最好的东西:createtable((selectfromINFORMATION_SCHEMA.COLUMNS))rowformatdelimitedfieldsby'|'; 最佳答案 您可以使用LIKE以便新表获取结构而不是数据